心理学没准就是一大堆发臭的胡说八道,不过倒也无伤大雅

原文:心理学没准就是一大堆发臭的胡说八道,不过倒也无伤大雅

你好,我想伸进你的脑袋把你对我挚爱之领域所持有的那些谬误一把扯出来

作者:Adam Mastroianni

2022 年 9 月 21 日

大约 10 年前,一位著名心理学家发现,人类拥有超自然的心灵感应能力。在 Daryl Bem 的实验室里,参与者猜测一张色情图片将出现在屏幕何处的准确率,竟然高于随机概率——甚至在电脑随机决定位置之前就猜到了。换句话说,在一件事情不可能被预知的情况下,人们似乎已经提前知道了——至少比纯粹蒙对的概率要高那么一丁点儿。

(你可能会问:为什么图片非得是色情的?Bem 没有解释,不过人们的心灵感应能力似乎只对香艳照片有效,对普通照片则毫无反应。也许,人们预知未来的天赋需要靠一点色心来激活。)

如果这只是个孤例,我们大可以一笑置之。但 Bem 的论文包含了九个实验,展示了各种形式的「预知」与「预感」能力。九个孤例,这实在太多了。

这让许多心理学家大为光火,因为人类本不应该拥有什么超自然能力。更要命的是,Bem 的论文发表在 Journal of Personality and Social Psychology 上,这是这一领域全球最权威的期刊。我们也无法把他当成什么不入流的民科——Bem 是康奈尔大学的终身教授,他的自我知觉理论是心理学导论课的必读内容。这位老兄来头不小,如今却声称 ESP(Extra-Sensory Perception的缩写,超感官知觉,俗称「第六感」) 确实存在,而且他的论文通过了同行评审,堂而皇之地出现在心理学最顶级的期刊之一上。

这是心理学史上那段至暗时期的第一场大灾难,这段时期后来被称为「复制危机」。同年晚些时候,第二波灾难袭来:一组心理学家证明,使用与所有人相同的统计手段,可以让听一首披头士歌曲看起来像是神奇地让大学生返老还童。第三波,也是最惨烈的一波,发生在 2015 年——一大群社会科学家尝试重做 100 项心理学研究,结果不到一半「复制成功」,意思是这些研究没能再次得出最初的结论,全部打了水漂。

2016 年,我开始读博,正好赶上跌入谷底的时刻。我看到一群眼眶深陷的研究生像遭了雷击一样四处游荡,仿佛父母刚打来电话说「我们从来就没爱过你,这一切都是个骗局,再见」。知名教授们把自己关在办公室里,洋洋洒洒地写起檄文(已被删除,但保存在这里),声称自己的研究之所以无法复制,全是因为那帮复制者心怀怨毒、不学无术。网上,因为某位女教授的一项研究未能复制,博主和评论者对她展开了无情的围攻,事情闹大到《纽约时报》专门为此写了一篇报道。而在派对上,每当我自我介绍说是心理学家,就免不了遇到某个大概只听过一期复制危机播客的家伙凑过来说「哦,但那些研究不都没法复制吗?」然后用那副得意的笑容打量我,就好像我刚坦白自己是一名文艺复兴节的演员——意思是,我乐于参与一种公开且令人尴尬的角色扮演。

天似乎要塌了,但包括我的博士导师 Dan Gilbert 在内的少数人坚持认为,天还在它该在的地方。当然,没有人真的相信 ESP 或大二学生逆龄生长这种事(也许除了 Daryl Bem),大家也都认同应该抛弃那些让这类幻想得以成立的研究做法。但那篇「大多数心理学研究无法复制」的论文走得太远了。Dan 和他的同事们指出,结论数据的噪声太大,以至于既可以解读为可复制性极好,也可以解读为极差。而且,挑出 100 项研究就声称可以代表整个心理学,就好比漫步到街角酒吧,随机问几个看起来友善的人,就宣称自己能预测选举结果。此外,某些复制研究用的完全是截然不同的方法。比如:

一项原始研究要求以色列人想象服兵役的后果,复制时却改成要求美国人想象度蜜月的后果;一项原始研究要求年幼儿童在大屏幕上完成较难的目标定位任务,复制时却换成让年长儿童在小屏幕上完成更简单的任务;一项原始研究以韩国人为对象,展示了改变慈善信件措辞如何提升回复率,复制时却变成向全球各地的人发送 771,408 封电子邮件(结果所有条件下的回复率几乎都是零)。

好了,总之就是这帮人说了这些,那帮人说了那些。到底该怎么想?你可以勤勤恳恳地把原始论文回应文回应的回应回应的回应的回应,以及回应的回应的回应的后续,全部认认真真读一遍。或者你就接着往下看,因为我有话要说——是一句从未听任何人说过的话,它在我胸腔里憋了好久,躁动不安,随时要像《异形》里那只外星生物一样破体而出。

所以,它来了。这篇文章既是写给、也是献给每一个在派对上冷笑的家伙——他们总是说「哦,心理学不全都是编出来的假货吗」,而我只能回答「哦,呃,其实——」,然后有人硬生生地挤到我们中间喊道「我的老天,Kyle,你怎么在这!来喝一杯!」……不用说,我们关于复制危机错综复杂的探讨也就到此为止了。

这篇,是为你而写的,Kyle。

笔既比剑更有力,也更方便堵住你那张嘴

首先,每当我们聊到复制危机,总是把两件截然不同的事搅和在一起。一件是「完蛋了,我们的研究方法、统计手段和证据标准烂到家了,搞得人人都能『证明』ESP 是真实存在的」——这确实很糟糕!我们理应有所作为,而且在很大程度上,我们已经做到了。以前,你拉来区区 20 名受试者,在某种条件下就敢宣称「嘿伙计们,我刚证明了脑子里想着足球流氓会让你变笨」(实际上根本不会)。放到今天,这样做只会让你被轰出门去。我认为这是好事!

但混进来的另一件事是「既然如此,我们现在就该回头把每一项心理学研究重新核查一遍」而这一点,我亲爱的 Kyle,在我看来毫无道理。先说第一点,你看过我们正在复制的那些研究吗?看看这一项

在回答了一组高难度常识题后,受试者脑海中与电脑相关的词汇比普通词汇更容易浮现;表现为在修改版斯特鲁普任务(一种测量词汇激活程度的心理学实验)中,电脑词汇启动后的颜色命名反应时间比非电脑词汇启动时更长。

再看这一项

原始研究发现,当人们被提醒自己正处于某段体验的尾声时,与未被提醒的人相比,会感到更加「百感交集」。我们关注该论文的研究 2(共 2 项),该研究在毕业典礼当天对大学毕业生进行了调查。毕业生被随机分为两组:一组被提醒这是他们作为学生的最后一天,另一组则没有收到任何提醒。随后毕业生对自己此刻的情绪进行评估。

还有这一项

在前一个练习中看到过「洛杉矶」这个词的参与者,会更偏好对这座城市具体而微观的描述;没有看到过的参与者,则更偏好抽象而宏观的描述。

我还可以一直列举下去——心理学里大多数研究本来就是这个样子。有一项备受瞩目的大规模复制研究,想要搞清楚反复划掉字母「e」之后,人们识别「哪个数字与众不同」的能力会不会变差。(后来还有第二次大规模复制尝试,换了个略有不同的方式来检验同一假设。)另一项大型复制研究则试图一劳永逸地解决这个问题:当人们用牙咬着笔、还是用嘴唇夹着笔时,他们会不会觉得笑话更好笑,就像这样:

img

就为了这个闹翻了天?

这些研究都没能通过实验历史检验:它们要么跟真实的人毫无关系,要么没让我有任何触动,或者两者兼而有之。我尊重原作者和复制者们的工作,但说实话,我真的不太在乎让人读了「洛杉矶」或者划掉一堆「e」之后会发生什么。在乎吗,Kyle?

这就是为什么,每当有人为「复制危机」大动干戈,我都一脸困惑。我理解有些人的职业生涯系于此,而且人人都爱看大牌教授出丑。但如果受到影响的不过就是这些研究,那又何必哭嚎切齿(最好先把含着的笔从嘴里拿出来)?为什么科学期刊里这些末日论调的文章一篇接着一篇(1, 2, 3, 4, 5),《大西洋月刊》(1, 2, 3, 4, 5)和《纽约时报》(1, 2, 3, 4, 5)这样的大众媒体也跟着轮番炒作?为什么派对上总有人来扫我的兴?说真的,Kyle,你到底想怎样?

我有个猜想。实际上,是三个猜想。我认为你脑子里装着三个关于科学运作方式的巨大谬误。而且我觉得不只是你,Kyle,我也不怪你——大多数心理学家,甚至大多数科学家,恐怕也信这些,因为我看到很多人的行事方式都像在把它们当真,却从未见有人试图去戳破它们。那就由我来做吧。再给我来一杯。

坍塌的城堡

好,有一件事我敢打赌你肯定相信,无论你是否意识到。你认为做科学就像建造一座宏伟的石制城堡。每一个发现,无论多么微小,都能让城堡更高、更坚固。如果你相信这一点,难怪你会觉得有些研究无法复制是个巨大的问题——这意味着地基在崩塌,整座城堡都可能倾覆。

我不敢妄言所有科学领域,但心理学不是这么运作的。我们没有宏大的统一理论。我们有一些局部理论,但大多数时候根本没有理论。所以我们并没有一座石头稳稳堆叠的宏伟城堡;我们有的只是几间石屋和散落一地的无数石块。这意味着,试图复制心理学研究有点像去踢其中的一块石头,看着它碎成粉末,然后感叹道:「啊哈!这上面什么都建不起来!」但问题是,那上面本来就没建任何东西。

你可以自己验证这一点。拿出手机,随便找一篇心理学论文,点击「被引用」(这里是那篇最初的“嘴里含笔”研究的页面),你可以在那里看到每一篇引用该研究的后续论文。当你看到成百上千甚至数千篇论文时,你可能会假设这意味着很多发现都依赖于这一发现的真实性。但事实并非如此。当你读几篇那些「被引用」的论文,你会发现即便删掉它们引用的那篇论文,几乎所有论文的内容都不会有任何改变。所以,即使一篇论文有海量的引用,大多也只是人们在指着那块石头,而不是把自己的石头叠在上面。

对我自己的工作来说确实如此。我回顾了自己最近发表的几篇论文,统计了引用次数,然后计算其中有多少是关键引用——意味着如果拿掉那篇论文,我的论文就会陷入大麻烦。平均而言,只有约 15% 的引用是关键的,而其中有一半是我使用的统计软件。

(你可能会问:既然如此,科学家为什么要往论文里塞那么多无关紧要的引用?问得好,Kyle。主要是为了讨好审稿人。比方说,如果你在写关于「[注意瞬脱](https://en.wikipedia.org/wiki/Attentional_blink#:~:text=Attentional blink (AB) is a,500 ms of the first)」的论文,你可以引用所有人对注意瞬脱发表过的所有看法,无论那是否与你的研究有关,以此证明你是个称职的小科学家。此外,你引用的人中,有些可能最终会审阅你的论文,你可以确信他们一定会寻找自己的名字。)

较老的科学领域可能比心理学更具累积性,但正如 Thomas Kuhn 在 60 年前指出的那样(你以为能开完这场派对而不被人搬出 Kuhn?想得美!),每个领域都会经历建造城堡和摧毁城堡的循环,许多石头在摧毁过程中无法幸存。比如,假设你当年跟着帕加玛的盖伦读博,没准你会写一篇关于痰液之类东西的论文,因为体液理论认为这是最重要的研究方向。然而体液理论后来被彻底推翻,你的论文也随之化为尘埃。抱歉了,老兄,这就是科学!再来一杯,Kyle,我还没说完呢。

青春期的科学

这是我认为你脑子里的第二个迷思,我要像挤粉刺一样把它挤破。

你可能看到人们获得博士学位、发表论文、找到工作等等,心想「嗯,这说明有什么重要的事情正在发生」。并非如此!这一切真的可能全是白费力气。这就是科学职业化后你会遇到的问题——它总是让一切看起来非常严肃且意义重大,哪怕事实并非如此。科学的很大一部分只是人们在玩科学游戏:拉动杠杆,得到结果,再拉几次,拿到资助,拉得足够多,你就能获得终身教职,这让你赢得了继续拉那个杠杆直到去世的权利。

心理学还有一个额外的问题:它是一门年轻的学科,我们对什么重要、什么不重要根本没有把握。一百年前,这个领域中的一个时髦理论是小男孩想杀掉他们的父亲并和母亲亲热。我们还在摸索,行不行?就像所有青少年一样,今天我们痴迷于某件事(穿一身黑、听 The Smiths、研究自我损耗),明天我们就转向了另一件事。这意味着漫无目的地复制心理学研究——就像我们目前一直在做的那样——有点像闯进一间挤满青少年的地下室并大喊:「我们必须一劳永逸地搞清楚,染蓝头发并在 Hot Topic 买衣服到底是真的酷,还是逊毙了!」然后人家会回你:哦伙计,冷静点,明天我们就会染成别的颜色,去别的地方买 T 恤,而且你是怎么进我们地下室的???

所以我认为,「大多数心理学研究能复制吗?」是一个错误的问题。正确的问题应该是「大多数心理学研究重要吗?」而我认为答案是:大概不重要。我知道这听起来像是在批评——「心理学好蠢啊,笑死」——但我真的是在做一种描述。我们并不清楚什么才是重要的,在弄明白之前,我们会做很多奇奇怪怪的事情,这没关系。

我自己也接受这种描述:我自己的研究是否重要也并不明确。我认为对话不会在人们想结束时结束很重要,人们不知道公众舆论发生了怎样的变化很重要,流行文化已经变成了寡头垄断也很重要。但如果你就是不在乎,我没有任何客观的东西能说服你。这不像你有一套你的物理学,我有一套我的,我们可以各自试着造一座桥,看看哪座屹立不倒,哪座会坍塌。你真的只能去闻很多想法,培养对「好想法」的嗅觉。这就是我读博的原因:我想跟着一个鼻子灵的人学习。

你可能认为数字和统计能区分重要与不重要的事情。它们做不到,Kyle!我们使用统计学是为了帮我们弄清什么是真实的。但很多真实的事情并不重要。「蒙住眼睛的人更容易撞车。」「当你大声播放 Insane Clown Posse 时,人们很难入睡。」「比起被踢头,人们更喜欢收到 5 美元。」我确信所有这些假设都能产生巨大的效应量。它们全是真实的,但没有一个是重要的

「如果科学的重要性只是一种主观判断,那又能怎样?」现在我们谈到关键点了。我真心认为,某些事情比其他事情更重要,这种重要性超越了任何个人的主观感受——尽管没有客观方式可以加以证明。我承认,Kyle,这是一种宗教般的信念。但相信它、在意它并为之辩护是非常重要的。(这就是为什么我写了《心理学中被低估的想法》的原因。)

我想你也信这一套,Kyle。你是个三十多岁的男人,所以你肯定认为《黑道家族》是比《爱之岛》更好的电视剧,尽管你也会承认这并非「客观上」更好。好,但如果我们就此举手投降,说「唉,反正没法客观判断哪种艺术更好」,那就没有任何理由去制作烧钱的精品剧,而不是廉价的垃圾了。偶尔来点廉价垃圾倒也无妨,但你我都想生活在一个能拍出《黑道家族》的世界里。为此,我们需要相信有些东西就是比其他东西更好,即便没有数据支持。心理学也好,任何科学也罢,道理都一样:要做出最好的工作,我们就必须相信有些问题值得追问,有些则不值得。哪怕根本没有客观标准来做这个判断。

所以,如果你觉得我的想法臭不可闻,那也没关系——少离我近点就行!但现在,老实待在那儿,Kyle,我还没跟你说完呢

我很遗憾地通知你:你仍然活在黑暗时代

Kyle,我还有一个迷思要告诉你。我确信你深藏于心,却从未宣之于口。

你认为自己出生在一个启蒙时代。你认为你的祖先深受萨满和江湖骗子之苦,而你正享受着几个世纪科学探索的果实。我理解这种信念。我们在高中拿到化学课本时,书后并没有一千页空白纸写着「我们尚未发现的所有化学知识」。课文一直印到封底,仿佛这就是化学的全部。

但是,Kyle,尽管自从伽利略举起望远镜、胡克俯身显微镜以来,人类学到了无数知识,我们依然活在黑暗时代。看看你的周围:物理学家不知道冷水和热水哪个先结冰发光的能量球偶尔会凭空出现,而没人知道为什么;身而为人会有某种感觉(「意识」),而对此我们没有任何像样的解释;宇宙中大约 85% 的物质是「假设性的」,意思是我们并不真正确定它是否存在。(这些层出不穷的谜团,正是我发誓要跟所有声称「好点子越来越难找」的人死磕到底的原因之一。)

只要去看一次医生,你就会立刻领会到我们身处的黑暗时代。肚子疼?你可能要加入 2500 多万被诊断为肠易激综合征的美国人行列,这个词简单来说意思是「我们不知道你为什么肚子疼」。得了癌症?我们最先进的癌症治疗归根结底就是「医生努力把你搞垮,而你只能祈祷癌细胞比你先挂」。情绪严重低落?医生能做的是:a) 跟你聊一会儿,看看有没有用;b) 给你一些药,可能一个月后会让你感觉好一点点(而且没人知道为什么);或者 c) [给你通电](https://www.psychiatry.org/patients-families/ect#:~:text=Electroconvulsive therapy (ECT) is a,the patient is under anesthesia)。

(顺便提一下,我们拥有的那些昂贵药物?其中大多数对大多数人都没有作用。)

我有扁平足,小时候脚疼得很厉害,于是我去看足科医生,满心期待在这个「科学与理性」的时代总该有些办法。他告诉我,他们可以打碎我的脚踝并重建,也许能让我多跑十年。或者他可以在我的脚踝里手术植入一个塞子,每六年更换一次。我告诉他,再想一想,我的脚也没那么疼。

我们生活在一个前所未有的光明时代,但我们依然所知甚少。如果你没有意识到这一点,每当你听说又一个科学发现未能复制,你可能会觉得自己的天赋权利被剥夺了。但那本来就不是你的。或者即便它是,它也属于每一个曾经活过的人,就像它属于你一样。数十亿人在无知中生老病死,你我也不例外。我们所能做的,就是努力让这个世界留下的无知比我们发现它时少一点点。

盗火

夜深了,Kyle。但我还有最后一件事必须告诉你。

你知道普罗米修斯吗——那位从众神那里盗取火种并赠予人类,使人类得以创造文明的希腊神祇?其实,世界各地的文化都有类似的传说:乌鸦、负鼠、蜘蛛,形形色色的骗子与英雄,窃取火种并交给凡人。而事实上,在这些故事中,火似乎更多是被盗取的,而不是被馈赠的。这是为什么?

也许是因为人类一直意识到,自然从不情愿交出她的秘密。如果你试着去探索她的丛林,她会派蛇和蚊子阻拦你。如果你试着去探索她的山脉、海洋或天空,她会剥夺你的氧气。你甚至无法探索细胞和原子,因为她把它们造得小到我们看不见。天呐,她竟然设定了柠檬能治坏血病而青柠却不行

于是,我们组建团队和工具去撬开自然的知识宝库。我们制定计划,招募专家。时机一成熟,我们就尽可能多地带走知识。事实上,每一个发现都是一次劫案。

最深、最难攻破的金库,是人类的心智。大自然用偏见和幻觉守护着它,还诱使我们[相信:仅凭身处其中,就足以了解自己的心智](https://home.csulb.edu/~cwallis/382/readings/482/nisbett saying more.pdf)。这正是我们在其他科学领域的进展远超心理学的原因。古希腊人发明了民主,算出了圆周率,建造了至今屹立不倒的宏伟柱廊——可他们同时相信,情绪是住在肝脏里的。NASA 将第一批卫星送入太空时,心理学家们还在断言:人类心智的内部运作永远无从知晓,所以根本不该去尝试。

没关系——这意味着我们仍有机会完成有史以来最伟大的劫案。科学中最宏大、最闪亮的明珠——人们为什么做他们所做的事?——依然躺在自然的金库里,等着我们去钻开铁锁、熔掉铰链、炸开大门,不惜一切代价。我要么偷走那颗明珠,要么死在路上。

所以,Kyle,如果今晚你没有别的收获,我希望你至少学会了不要仅仅根据你听过的一期播客就去质疑别人整个人生的意义。现在失陪一下,我真的要去趟洗手间了。